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Bescheinigung 



Die VOLKSWAGEN Aktiengesellschaft in Wolfsburg/Deutschland hat eine 
Patentanmeldung unter der Bezeichnung 





"Verfahren und Einrichtung zum Betrieb von sprachunterstutzten 
Systemen in Kraftfahrzeugen" 



am 18. Juni 1998 beim Deutschen Patent- und Markenamt eingereicht und 
erklart, da& sie dafur die Innere Prioritat der Anmeldung in der Bundesrepublik 
Deutschland vom 6. Mai 1998, Aktenzeichen 198 20 000.5. in Anspruch nimmt. 

Die angehefteten Stucke sind eine richtige und genaue Wiedergabe der ursprung- 
tichen Unterlagen dieser Patentanmeldung. 
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Verfahren und Einrichtung zum Betrieb von sprachunterstUtzten Systemen 

in Kraftfahrzeugen 



m 



Die Erfindung betrifft ein Verfahren sowie eine Einrichtung zum Betrieb von sprach- 
unterstUtzten Systemen. wie Kommunikations- und/oder Sprech- /Gegensprech- 
einrichtungen In Kraftfahrzeugen, bei weichem bzw. bei welcher iiber eine 
K/Iehrfachmikrofonanordnung Sprachsignale aufgenommen und an mindestens einen 
Lautsprecherweitergegeben werden, gemSR Oberbegriff der Patentansprtiche 1 und 7 . 

Verfahren dieser Art werden in Kraftfahrzeugen zum einen zum sprachunterstUtzten 
Gegensprechbetrieb eingesetzt, Oder aber auch zur Unterstutzung von sprachein- 
gabegesteuerten elektronischen Oder elektrischen Baugruppen. Die grundsatzliche 
Problematik hierbei ist. daS im Kraftfahrzeug je nach Betriebszustand eine entsprechende 
Gerauschkuiisse vorhanden ist. Diese uberdeckt die Sprachbefehie. Sprech- und 
Gegensprechanlagen in Kraftfahrzeugen sind ubenviegend bei groBen Fahrzeugen. 
IVIinibussen und dergleichen vorteilhaft. Sie konnen jedoch auch bei normalen 
Personenkraftwagen eingesetzt werden. Bei der Verwendung von sprachgesteuerten 
-ingabeeinheiten fur elektrische Komponenten im Fahrzeug ist die Unterdriickung der 
erauschkulisse bzw. das Herausfiitem des Sprachbefehles noch von besonderer 
Bedeutung. 



So ist aus der EP 0078014 B 1 eine Spracherkennungseinrichtung fur ein Kraftfahrzeug 
bekannt. bei weichem in das Verstari<ersystem der Spracheri<ennungseinrichtung uber 
Sensoren gemeldet bzw. eingespeist wird. ob der Motor in Betrieb ist und/oder sich das 
Fahrzeug bewegt. Danach richtet sich sodann eine Pegaibeeinflussung mit der versucht 
wird. den Sprachbefehl aus der Gerauschkuiisse herauszufiltem. 

Aus der DE 3742929 C 1 ist eine Anordnung mit zwei Mikrofonen bekannt. wobei eines der 
Mikrofone am Mund der Bedienperson angeordnet ist und ein anderes in der NShe. jedoch 
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zur Aufnahme des Korperschalles. Beide Mikrofonsignale werden getriggert derart. dafi 
Korperschall vom Gesamtschall subtrahierbar ist. 

Aus der DE 19705471 A 1 ist bekannt, eine Spracherkennung mit Hilfe einer Trans- 
versalfilterung zu unterstCitzen. Hierbei wird eine Frequenzanalyse vorgenommen. die 
jedoch lediglich zu dem Zweck der Sprachbefehlserkennung dient. Es findet hierbei keine 
Nebengerauschkompensation statt. 

Aus der WO 97/34290 ist eine Filterung bekannt. bei der periodische Storsignale 
ausgefiltert werden. in dem deren Periode ennittelt und mittels Generator herausinterferiert 
wird, so dali das Sprachsignal ubrig blelbt. 

Aus der DE 4106405C 2 ist ein Verfahren bekannt. bei dem eine Gerauschsubtraktion vom 
Sprachsignal erfolgt. wobei eine Mehrzahl von Mikrofonen verwendet wird. 

Aus der DE 3925589 A 1 Ist die Verwendung einer Mehrfachmikrofonanordnung bekannt. 
wobei bei Anwendung im Kraftfahrzeug eines der Mikrofone im Moton-aum und ein weiteres 
im Fahrgastraum angeordnet ist. Sodann erfolgt eine Subtraktion beider Signale. Nachteilig 
ist hierbei. dali lediglich das Motorgerausch bzw. das eigentliche Betriebsgerausch des 
Fahrzeuges selbst vom Gesamtsignal im Fahrgastraum abgezogen wird. Spezifische 
Nebengerausche werden hierbei unberucksichtigt gelassen. Ebenso fehit eine 
Ruckkopplungsunterdriickung. die eine besondere Problematik darstellt. Uberall dort, wo 
Mikrofone und Lautsprecher in akustisch ankoppelbarer Nahe angeordnet sind. kommt es 
vor. dali das am Lautsprecher ausgekoppelte akustische Signal wiederum in das Mikrofon 
uckeinspeist. Es kommt zu einer sogenannten Riickkopplung und einer darauf folgenden 
Obersteuerung. 



Der Erfindung liegt somit die Aufgabe zugrunde. ein Verfahren sowie eine Einrichtung der 
gattungsgemalien Art dahingehend weiterzubilden. daB Ruckkopplungen und Instabilitaten 
die bei Anordnung mehrerer Mikrofone und Lautsprecher auftreten zu unterdrucken. 

Die gestellte Aufgabe ist bei einem Verfahren der gattungsgemaBen Art erfindungsgemali 
durch die kennzeichnenden Merkmale des Patentanspruches 1 gelost. 

Weitere vorteilhafte Ausgestaltungen des Verfahrens sind in den Anspriichen 2 bis 5 
angegeben. 




Hinsichtlich einer Einrichtung der gattungsgemaBen Art ist die gestellte Aufgabe 
erfindungsgemau durch die kennzeichnenden Merkmale des Patentanspruches 6 gelost. 
Weitere vorteilhafte Ausgestaltungen der einrichtungsgemaSen Erfindung sind in den 
ubrigen Anspruchen angegeben. 

Die Erfindung gefit sowohl hinsichtlich des Verfahrens als auch der Einrichtung von einer 
Kommunikations- und/oder Sprech- /Gegensprecheinrichtung in Kraftfahrzeugen aus. Es ist 
auch bekannt. hierbei eine IVIehrfachmikrofonanordnung anzuordnen. daruber hinaus 
Sprach- als auch Gerauschsignale aufzunehmen und vom Gesamtsignal die 
Gerauschsignale wiederum zu subtrahieren. so daS das Sprachsignal gefiltert ubrig bleibt. 

iGemaS der gestellten Aufgabe besteht der Kern der Erfindung darin. daB das jeweilige 
Mikrofonsignal zunachst urn einen kleinen Betrag A F frequenzverschoben wird, und 
nachfolgend erst auf den Oder die Lautsprecher Oder auf die Eingabe einer sprach- 
gesteuerten Einrichtung gegeben wird. Die erfindungsgemaBe Frequenzverschiebung. die 
hierbei an definierter Stelle vorgenommen wird und nicht willkiirlich ist, unterstiitzt zum 
einen die Filterung und zum anderen werden Riickkoppelungen. also auch das Echosignal 
ausgekoppelt. 



Da Ruckkopplungen ohne die besagte erfindungsgemaBe Frequenzverschiebung nichts 
weiter sind als das ruckgekoppelt verstarkte Sprachsignal, konnen mit Mittein und 
Vorgehensweisen aus dem zitierten Stand der Technik solche Ruckkopplungen nicht 
9 ^^®''miniert werden. Dies aus dem besagten Grund, weil Einrichtungen der bekannten Art 
^^ediglich das Sprachsignal vom Gerauschsignal separieren und das riickgekoppelte Signal 
als Sprachsignal und nicht als Gerauschsignal identifizieren. Dadurch sind die besagten 
Ruckkopplungen mit Hilfe der im Stand der Technik bekannten Mittel nicht, oder nicht 
glelchzeitig beherrschbar. 



Demgegenuber wird jedoch durch das erfindungsgemaBe Verfahren sowie durch 
erfindungsgemaBe Einrichtung. die sich auf die Verschaltung der einzelnen Elemente 
miteinander bezieht werden auf elegante Weise Riickkopplungseffekte eliminiert. 

Da die Ruckkopplung als solches ursachlich immer dann auftritt, wenn Mikrofonort und 
Lautsprecherort dicht beieinander liegen, was in Kraftfahrzeugen zwanghaft der Fall ist, 
kommt der Eliminienjng dieser Ruckkopplung im genannten Anwendungsfall ganz 



erhebliche Bedeutung zu. Dies gilt nicht nur im Falle des Gegensprechbetriebes. bei dem 
elektroakustische Ruckkopplungen fur die Insassen unangenehm sind, sondern besondere 
Bedeutung kommt auch beim Einsatz sprachgesteuerter Eingabeschnittstellen von 
elektrischen bzw. elektronischen Bauteilen am Kraftfahrzeug zu. Dies gilt nur dann, wenn 
die gesamte Anordnung im Fahrzeug sowohl Mikrofone als auch Lautsprecher umfaSt, und 
hieruber auch die sprachgesteuerte Eingabe an elektrische Gerate erfolgt. Ruckkopplungen 
und daraus resultierende Ubersteuemngen konnen selbst bei intelligenten 
Eingabeschnittstellen erhebliche Fehlfunktionen und Milideutungen des Sprachbefehles 
hervoHTjfen. Je nach Einsatzfall stellt dies auch ein Sicherheitsrisiko dar. Wahlweise kann 
die gleichzeitige Gerauscheliminiemng zusatzlich, d.h. gleichzeitig vorgenommen werden. 

Die Erfindung ist in der Zeichnung dargestellt und nachfolgend naher beschrieben, 

^^^Die Abbildung zeigt den prinzipiellen Aufbau sowie auch die Funktionsweise. so daS aus 
der Abbildung selbst sowohl die Verfahrensmalinahmen, als auch die Verschaltung der 
einzelnen einrichtungsgemafSen Elemente zueinander in ihrer logischen Gesamtheit 
erkennbar ist. bzw. sind. 

In diesem dargestellten Ausfiihrungsbeispiel der Erfindung ist der Fahrzeuginnenraum in 
zwei Teilraume unterteilt, namlich vorne und hinten. 

Im vorderen Teil befindet sich ein Mikrofon M 1 und ein Lautsprecher L 2 . 

Das Mikrofon M 1 nimmt das dortige Sprachsignal und ggf. Gerauschsignale auf. Das 

•Gerauschsignal besteht dabei aus der sich im Betrieb des Fahrzeuges ergebenden 
berauschkulisse im Fahrgastraum. Dies konnen Motorengerausche, Windgerausche sowie 
Abrollgerausche aber auch akustische Echosignale aus dem anderen Teilraum und 
dergieichen mehr sein. Das an M 1 enthaltene Summensignal aus Sprache- und 
Gerauschkulisse wird einem ersten Summationspunkt S 1 zugefuhrt. Diesem 
Summationspunkt wird dann ebenfalls ein entsprechend aufbereitetes Signal aus einem 
akustischen Model AM 1 vorne, zugefuhrt. Das im akustischen Modell AM 1 generierte 
Subtraktionssignal entstammt in diesem Ausfiihrungsbeispiel aus dem im hinteren Teil des 
Fahrzeuges erhaltenen. und bereits frequenzverschobenen Signal. Dadurch. dall dieses 
von M 2 kommende und in F 2 frequenzverschobene Signal, welches dem hinteren 
Teilraum der Fahrgastzelle entstammt, uber AM 1 signaltechnisch auch vorne beriicksichtigt 
wird. wird die im hinteren Teil des Fahrzeuges generierte und nach vorne. in den vorderen 
Teil der Fahrgastzelle akustisch transportierte Teil, welcher auch von M 1 registriert wird. 



am Summationspunkt S 1 wiedenjm subtrahiert. D.h., durch die Einrichtung AM 1 wird der 
hintere Teilraum der Fahrgastzelle vom vorderen Teilraum der Fahrgastzelle akustisch 
getrennt. D.h.. zunachst wird in M 1 das gesamt wahmehmbare akustische Signal 
eingespeist, und am Summationspunkt S 1 zunachst das Echo vom hinteren Teilraum der 
Fahrgastzelle subtrahiert. Das so erhaltene originare Signal von M 1 aus dem vorderen 
Teilraum der Fahrgastzelle wird sodann einer Frequenzverschiebeeinrichtung F 1 zugefuhrt 
und um einen Betrag A F, beispielsweise 5 Hz, verschoben. Das so erhaltene 
Ausgangssignal von M 1 wird sodann dem Lautsprecher LI des hinteren Teilraumes der 
Fahrgastzelle zugefuhrt und zum anderen gleichzeitig auch wiederum auf die gleiche Weise 
in die Einrichtung AM 2 eingespeist. AM 2 reprSsentiert dabei wieder das akustische Modell 
fur den hinteren Teilraum der Fahrgastzelle. Die Obermittlung einer Sprachnachricht vom 

•hinteren Teilraum der Fahrgastzelle iiber M 2 zum vorderen Teilraum der Fahrgastzelle 
liber L 2 erfolgt in analoger Weise. D.h., das Mikrofon M 2 registriert die Sprachnachricht 
samt Gerauschkulisse im hinteren Teilraum der Fahrgastzelle und ubermittelt sie an den 
Summationspunkt S 2 , an welchem das uber M 1 aufgenommene akustische 
Gesamtsignal, d.h.. das Echo sowie Nebengerausche, subtrahiert wird. Das so wiederum 
erstellte echofreie Signal von dem Mikrofon M 2 wird sodann ebenfalls einer 
Frequenzverschiebeeinrichtung F 2 zugefuhrt, die wiedemm eine Frequenzverschiebung 
um einen Betrag A F vomimmt. Am Ausgang dieser Frequenzverschiebungseinrichtung F 2 
wird das Ergebnis bzw. das so aufbereitete Signal wiedenjm dem vorderen Teilraum der 
Fahrgastzelle, namlich dem dort positionierten Lautsprecher L 2 zugefuhrt. Die 
Frequenzverschiebung fur die Obermittlung von vome nach hinten kann auch vor 
derjenigen Frequenzverschiebung von hinten nach vorne unterschieden sein 

sgesamt ergibt sich ein geschlossenes riickkopplungsfreies System. Dabei ist die 
Verschiebung der Frequenz ein wesentliches Merkmal, und durch das Zusammenwirken mit 
der Verschaltung uber die akustischen Modelle AM 1 und AM 2 ist eine Echoeliminierung 
vom vorderen zum hinteren Teilraum und umgekehrt gegeben. 

Es ist jedoch auch moglich, daS zusatzlich zur Echounterdruckung und 
Riickkopplungseliminiemng auch eine Gerauschsignalsubtraktion hinzukommt. Dies kann in 
geeigneter Weise im jeweiligen akustischen Modell AM1 und AM 2 mitberucksichtigt 
werden. Die weitergehenden, hierzu notwendigen Komponenten. wie 
Gerauschsignalmikrofone. sind dabei nicht weiter dargestellt. 
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Somit laBt sich also sagen. daS jedes akustische Eingabesignal von M 1 sowie auch von M 
2, bevor es weitergehend aufbereitet und den Lautsprechem L 2 bzw. L 1 zugefuhrt wird, 
das aus Echo und iibrigen Gerauschen zusammengesetzte Gesamtgerauschkulissensignal 
subtrahiert wird. Es findet somit nicht nur eine akustische Abkoppiung zwischen vorderem 
und hinterem Teilraum der Fahrgastzelle statt, sondem auch die iibrigen Gerauschsignale 
warden quasi in ein und demselben Aktionsschritt mitkompensiert bzw. subtrahiert. 



• 
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PATENTANSPRUCHE 



Verfahren zum Betrieb von sprachunterstiitzten Systemen, wie Kommunikations- 
und/oder Gegensprecheinrichtungen in Kraftfahrzeugen. bei welchem uber eine 
Mehrfachmikrofonanordnung Sprachsignale aufgenommen und an mindestens einen 
Lautsprecher weitergegeben werden, 
dadurch gekennzeichnet, 

daS das Sprachsignal bzw. das Sprachsignalspektrum zunachst urn einen Betrag A F 
frequenzverschoben wird und nachfolgend erst auf den oder die Lautsprecher oder auf 
die Eingabe einer sprachgesteuerten Einrichtung gegeben wird. 

2. Verfahren zum Betrieb von sprachunterstutzten Systemen. nach Anspruch 1 . 
dadurch gekennzeichnet, 

daS jeweils vor Obennittlung des Signales an die Lautsprecher das Echo aus dem 
lautsprecherbezogenen Umfeld vom Signal des hierfur betatigten mikrofonbezogenen 
Umfeldes subtrahiert wird. 

Verfahren zum Betrieb von sprachunterstutzten Systemen. nach Anspruch 1 oder 2. 
dadurch gekennzeichnet, 

daS bei Venwendung einer l\/lehrzahl von l\/Iikrofonen jedes akustische Aufnahmesignal 
einesjeden IVIikrofones nach Subtraktion des jeweils lautsprecherbezogenen Umfeldes 
bzw. des dort generierten Gerauschsignales. um A F frequenzverschoben wird. 

Verfahren zum Betrieb von sprachunterstutzten Systemen. nach einem oder mehreren 
der vortiergehenden Anspriiche. 
dadurch gekennzeichnet, 

daB zur akustischen Ankopplung bzw. Subtraktion der Gesamtgerauschkulissensignale 
ein beliebiges akustisches Modell aus den aufgenommenen Gesamtsignalen gebildet 
wird und signaltechnisch zwischen jeweiligem Mikrofon und jeweiliger 




Frequenzverschiebung auf einen jeweiligen Summationspunkt zur Subtraktion 
aufgegeben wird. 

5. Verfahren zum Betrieb von sprachunterstutzten Systemen nach Anspruch 4, 
dadurch gekennzeichnet, 

daB der Fahrgastraum des Fahrzeuges in mindestens zwei akustisch Teilraume 
aufgeteilt ist, derart. daS in jedem Tellraum zumindestens ein Mikrofonort als auch 
mindestens ein Lautsprecherort vorhanden ist, daS zwisclien Mikrofonort des einen 
Teilraumes und dem Lautsprecherort des anderen Teilraumes die besagte 
Frequenzverschiebung Delte F erfolgt und zwischen den Lautsprecherorten und 
Mikrofonorten des einen Teilraumes und zwischen den Lautsprecherorten und 
Mikrofonorten des anderen Teiltraumes die besagten akustischen Modelle angewendet 
werden, so daS signaitechnisch ein geschlossener elektroakustischer Regelkreis 
entsteht. 

6. Verfahren zum Betrieb von sprachunterstutzten Systemen nach einem Oder mehreren 
der vorhergehenden Anspruche, 

dadurch gekennzeichnet, 

daR uber die besagten akustischen IVIodelle nicht nur die Sprach- und/oder 
Gerauschsignale der unterschiedlichen Teilraume in der Fahrgastzelle berucksichtigt 
werden, sondem zusatzlich ermittelte tm gesamten Umfeld bestehende Gerausche 
mitberiicksichtigt und vom Gesamtschallsignal subtrahiert werden, so daS im 
wesentlichen das Sprachsignal ubrig bleibt. 

7. Einrichtung zum Betrieb von sprachunterstutzten Systemen, wie Kommunikations- 
und/oder Gegensprecheinrichtungen in Kraftfahrzeugen. mit einer Mehrzahl von 
Mikrofonen und Lautsprechem, sowie mit Mittein zur Obertragung von 
Sprachnachrichten oder Sprachbefehlen 

dadurch gekennzeichnet, 

daR der Fahrgastraum im Kraftfahrzeug in mindestens zwei ggf. offene Teilbereiche 
(vome, hinten) mit Jewells mindestens einem Mikrofon (Ml. M2) und mindestens einem 
Lautsprecher (L1. L2) unterteilt ist, daB die besagten Mittel auch 
Frequenzverschiebeeinrichtungen (F1, F2) umfassen. welche zwischen jeweils einem 
der Mikrofone (M1, M2) und dem im jeweils anderen Teiibereich (vome, hinten) 
befindlichen Lautsprecher geschaltet ist. und daB das jeweils resultierende 
Lautsprechersignal parallel abgreifbar und dem jeweils im selben Teiibereich 




angeordneten Mikrofonsignal uber Summationspunkte (SI. S2) subtraktiv iiberiagerbai 
ist. 

Einrichtung zum Betrieb von sprachunterstiitzten Systemen nach Anspruch 7. 
dadurch gekennzeichnet, 

dali zwischen Parallelabgriff des jeweiligen Lautsprechersignales und dem jeweiligen 
Summationspunkt (SI. S2) Mittel (AM1, AM2) vorgesehen sind. iiber welche 
sogenannte akustische Modelle generierbar sind. die das jeweilige Lautsprechersignal 
beeinflussen/nachbearbeiten und das Ergebnissignai aus (AIVI1) und (AM2) auf den 
jeweiligen Summationspunkt schaltbar ist. 

Einriclitung zum Betrieb von sprachunterstiitzten Systemen nach Anspruch 8, 
dadurch gekennzeichnet, 

daS die akustischen Modelle (AMI. AM2) Mittel zur Gerauschmustererkennung 
enthalten. die zur Separierung von Motor-ZFahrgerauschen von sprachgenerierten 
akustischen Signalen. sowie zur Separierung primar sprachgenerierter Signale von 
riickgekoppelten Echosignalen dienen. 
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ZUSAMMENFASSUNG 

Verfahren und Einrichtung zum Betrieb von sprachunterstiitzten Systemen in 

Kraftfahrzeugen 



•Die Erfindung betrifft ein Verfahren sowie eine Einrichtung zum Betrieb von sprach- 
bnterstutzten Systemen. wie Kommunikations- und/oder Sprech/Gegensprechein- 
richtungen in Kraftfahrzeugen. bei welchem bei einer Mehrfachmlkrofonanordnung 
Sprachsignaie aufgenommen und an mindestens einen Lautsprecher weitergegeben wird. 
Urn bei einem Verfahren sowie einer Einrichtung dieser Art zu gewahrieisten. daB 
Riickkopplungen eliminiert werden. ist erfindungsgemaS vorgeschlagen. daS das 
Sprachsignai bzw. das Sprachsignaispektrum zunachst urn einen kleinen Betrag A F 
frequenzverschoben wird und nachfolgend erst auf den oder die Lautsprecher oder auf die 
Eingabe einer sprachgesteuerten Einrichtung gegeben wird. 

(Fig.) 
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